查看原文
其他

德国张益唐: 刷牙时破解50年谜题

2017-04-09 Paris 知社学术圈

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

2014年7月17日早上,托马斯·罗恩 (Thomas Royen) 在刷牙的时候灵光一闪,找到了解决著名数学猜想的思路。这个猜想涉及到几何、概率论和统计学,困扰了顶尖专家几十年。而罗恩不过是一位默默无闻的退休统计学者。


这一猜想源于上世纪50年代,被称作Gaussian correlation inequality (GCI)。1972年有人给出其最优雅的形式后,它便一直困扰着数学家们。宾州大学统计学家唐纳德·理查德 (Donald Richards) 说:“我知道有人在这一工作上花了40年,我自己也研究了30年。”



在洗手池旁找到证明猜想的“原始思路”以前,罗恩没有太多关注这一问题。1985年,身为制药公司员工的罗恩转入了德国宾根的一所小型技术大学,以便有更多时间改进统计学公式——这是他以及业界同僚曾用于分析药物试验数据的工具。


2014年7月,67岁的罗恩虽然已经是一位退休老人,但始终没有放开这项工作。他发现GCI可以被扩展到一个他所擅长的关于统计学分布的描述中。17日早上,他找到了计算扩展GCI关键导数的方法,实现了证明。“那天晚上,我就把证明初稿写好了。”


由于不懂LaTex,他只能在Word文档中书写他的计算。次月,论文完成,并出现在预印本网站arxiv.org上。他还把文章发给了理查德,后者在一年半前曾介绍过其对GCI的一次失败证明。理查德回忆:“我是从邮件收到了他的文章。看到的时候,我立刻就知道,这事解决了。”


一看到那份证明,“我恨不得捶自己。”理查德说。几十年来,他和其他学者一直在想方设法地努力破解GCI猜想,甚至有些大胆的新想法认为,这需要凸几何、概率理论或分析才能证明。有些数学家在多年的徒劳无功之后,开始怀疑这个猜想是错误的。然而,罗恩给出的证明非常简洁,只用了些经典技巧,篇幅不过几页纸。理查德感到颇为震撼,自己和其他人居然都错过了。“但是从另一方面讲,我不得不说当自己看到证明的时候,那是一种解脱。记得我曾这样想过,能在有生之年看到证明是再好不过了。我真的很高兴能够看到它。”


在理查德的帮助下,几位同事帮助罗恩用LaTex重新写好论文,使其更符合现在的专业习惯。不过意想不到的是,理查德和罗恩联络过的其他专家对于这突如其来的成果表示不屑。多少年来,关于GCI的虚假证明可谓满天飞,有两篇还挂在了arxiv.org上。来自魏茨曼科学研究所和特拉维夫大学的Bo’az Klartag曾收到过大量所谓的证明,2015年也从同事那里收到过罗恩的证明。由于时间有限,他只查阅了一个,还发现了其中的错误。因此,罗恩的成绩当时被忽略了。



这样鲜为人知的证明可能起初无法得到重视,但这不会太久:像罗恩这样的重要论文可以发表在Annals of Statistics这样的期刊上,然后自然就众人皆知了。然而,罗恩并不需要再去经营事业,他选择跳过周期较长且往往需要同行评议的典型期刊,转投到能够快速出版的Far East Journal of Theoretical Statistics,这是印度Allahabad的一本期刊,并不为业界所了解。在期刊网站上可以看到,罗恩正是一名编辑。(他在论文发表前一年加入了编委会。)


尽管以此方式推出,但证明依然未得到重视。最终,在2015年12月,波兰数学家Rafal Latala和他的学生Dariusz Matlak发出一篇论文,其中展现了罗恩的证明,并重新组织内容,使人们更易看懂。消息就这样传开了。在距离宾根仅65英里的Heidelberg Institute for Theoretical Studies,统计学家Tilmann Gneiting在2016年7月看到这个证明,十分震惊。这已经是GCI被证明的两年后了。当本文作者在上个月邀请费城天普大学的统计学家Alan Izenman对此进行评论时,他居然还没有听说过此事。


人们很奇怪为什么在21世纪的今天,罗恩证明的消息传播得如此之慢。“显然,在这个非常容易进行交流的时代,我们很缺乏交流。”Klartag这样说,“不过无论如何,至少我们还是看到它了。它真的美极了。”


GCI猜想最知名的形式出现在1972年,它涉及到概率与几何:这为飞镖比赛选手击中靶子的几率设置了更低的边界,包括假想的多边形飞镖比赛。



设想两个凸多边形,比如一个矩形和一个圆形,它们的中心是需要选手瞄准的目标。掷出的飞镖将落在一个正态分布中,或者说围绕中心点的“高斯分布”。GCI所讲的是,飞镖既落在矩形中又落在圆形中的概率总是等于或高于单独落在矩形中的概率和单独落在圆形中的概率的乘积。也就是说,由于两个图形重叠,击中其中一个图形可以提高你击中另一个图形的几率。这样的不等式被认为适用于任何两个对称的凸多边形,只要中心维持在一点上。


某些特殊条件下的GCI此前已经被证明过。比如1977年,弗吉尼亚大学的Loren Pitt论证了二维凸多边形。不过,一般条件下的证明还是令所有数学家都感到困惑。Pitt在1973年Albuquerque的一次会议上首次从同事那听到这个不等式。他回忆说:“作为一个傲慢的青年数学家,看到那些自视为数学家和科学人的前辈们都不知道这个答案,我很震惊。”Pitt曾把自己锁在汽车旅馆里,声称如果不能证明或证伪这一猜想,就不出来。“近五十年了,我依然不知道答案。”


尽管数百页的计算漫无目的,Pitt和其他数学家却坚信——凭借二维的论证——GCI的凸多边形框架将能够引向普遍条件的证明。“我已经发展出一种概念性的思路,以致于可能太过执着了,”Pitt说道,“而罗恩所做的和我脑袋里的东西截然不同。”


罗恩的想法要从他在制药行业中的经历说起,当然还有那令人费解的不等式本身。在提出对称凸多边形的说法以前,GCI已由美国统计学家Olive Dunn在1959年提出,作为计算“同步置信区间”的方程,或者说估算多变量的取值范围。


假设你想估算出一个体重和身高的范围,使得样本中95%的人口都在其中。如果把人们的体重和身高映射到x-y坐标图中,那么体重将沿着x轴构成一个高斯正态分布。身高也将沿着y轴构成正态分布。合在一起,体重与身高就形成了一个二维正态分布。你可以这样提问,体重和身高的范围是什么——–w < x < w且  –h < y < h——使95%的人口集中在这些范围构成的矩形区域中?


如果体重和身高是独立的,那么你可以计算出体重满足-w < x < w的独立几率,以及身高满足-h < y < h的独立几率,然后将两者相乘,得到同时满足两种条件的几率。但是,体重和身高是相关的,就像飞镖和重叠形状,如果某人的体重处在正常范围内,那么他应该更倾向于有正常的身高。Dunn三年前概括出一个不等式,作出以下猜想:高斯随机变量同时落在矩形区域内的几率总是要大于或等于每个变量落在自身特定范围内的独立几率的乘积。(变量个数可以是任意多个)如果变量是独立的,那么联合概率等于独立概率的乘积。但是变量间的任何关联都会导致联合概率升高。


罗恩发现,他可以归纳GCI,使其不仅适用于随机变量的高斯分布,还能适用同高斯分布的平方相关联的统计分布,即伽马分布。这在一些统计测试中有所应用。罗恩说,“在数学里,常常有这样的情况发生:一个看起来困难的特殊问题能够通过回答一个更为普遍的问题而得到决解。”



罗恩在其归纳的GCI中通过因子C表示参数间关联的数量。当C=0时(对应于像体重或眼睛颜色这样的独立变量),函数等于独立概率的乘积。当你将关联调至最大,C=1,此时函数等于联合概率。为了证明后者大于前者,且GCI真实存在,罗恩需要证实其函数总是随着C的增大而增大。如果其导数或者变化率相对于C一直是正的,那么结果确实如此。


罗恩对于伽玛分布比较熟悉,这促成了他在洗手池旁的灵光一现。他明白,可以通过一个经典的技巧将他的函数转化得更为简单。突然,罗恩认识到这一函数变形后的导数与原始函数的导数是等价的。他可以很容易展示出后者一直是正的,从而证明了GCI。Pitt对此表示:“他掌握的方程使其能够施展他的魔法,我并不了解那些公式。”


任何一个统计学研究生都能理解这样的论证。罗恩说,他希望“这令人惊讶的简单证法可以鼓励年轻学生发挥创新思维,去发现新的数学定理,”因为“很高的理论水平并不总是必须具备的。”


不过,有些学者仍然希望看到GCI的几何学证明,这将有助于解释凸几何中奇妙的新问题。Pitt也特别指出,GCI定义了重叠的凸多边形表面向量的有趣关系,这将引出凸几何学一个新的分支领域。“至少我们知道了这是真的,”他在讲到向量关系时说,但“如果有人能够看透这种几何,那么我们将能够以新的方式理解一个类型的问题。”


GCI除了具有几何学意义,其不等式的变体还能帮助统计学者预测诸如股票价格随着时间波动这样的参数范围。在概率论中,对GCI的证明将能够帮助进行更精确的比率计算,就像“小球”概率那样,涉及到流体中粒子移动的随机路径。理查德说,他已经提出了几个对GCI扩展的不等式猜想,现在他想用罗恩的方法来尝试证明。


罗恩的主要兴趣在于改进在很多统计测试中用到的方程的实用计算。比如,基于对多种变量的测量 (病人的反应时间和身体摆动等),确定一种药物是否会让人产生疲劳感。他说,他扩展的GCI确实能够改进这些工具。近期和GCI有关的其他一些工作也带来了进一步帮助。至于证明没有得到太多反响,罗恩并不感到失望。“我习惯于常被德国顶尖高校的科学家所忽视,”他在一封邮件中这样写道,“我并不擅于维护人际关系,我生活的质量也不依靠这些。”


找到一个重要证明带来了“深深的喜悦与感激之情”,这已经是足够的褒奖。“这就像是一种恩赐,”罗恩说,“我们可以长时间从事一项研究,然后天使突然降临——为了我们心中的秘密,诗一般地站在这里——带给你一个主意。”


原文链接

https://www.quantamagazine.org/20170328-statistician-proves-gaussian-correlation-inequality/

扩展阅读
 

从莫扎特背乐谱到傅里叶变换: 2017阿贝尔奖背后的故事

张益唐: 庾信平生最萧瑟, 暮年诗赋动江关

张益唐:我的数学人生

陶哲轩: 数学少年的奇幻之旅

望月新一: 小李飞刀重现数学江湖

中国数学天才的华美四重奏: 统一数论与几何

如需转载或者合作请看下方↓↓↓

投稿、授权、合作事宜请联系

service@scholarset.com 或微信ID: scholarset

回复“目录”或“分类”,浏览知社更多精华。长按二维码识别,可以关注/进入公众号进行回复。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存